Recherche d'informations dans la blogosphère : Défis et premières évaluations
نویسندگان
چکیده
This paper describes the main retrieval problems when facing with blogs. Using the classical tf idf vector-space model together with three probabilistic and one statistical language model, we evaluate them using a TREC test-collections composed of 100 topics. Using two performance measures, we show that ignoring a stemming approach results in a better performance than other indexing strategies (light or Porter’s stemmer). MOTS-CLES : Blogosphère, Domaine spécifique, Evaluation, Modèle probabiliste, TREC.
منابع مشابه
Architecture des bases d'Images Généralistes Organisées en Clusters
Résumer. Les développements actuels, en matière de technologie liée à l’information numérique, ont permis l’acquisition et le stockage d’une quantité importante d’information, ce qui a engendré la nécessité d'élaborer des systèmes permettant la gestion de ces données (plus particulièrement les bases de données images). La recherche d’images par le contenu tente de répondre à ces besoins en se b...
متن کاملTraduction automatique de termes biomédicaux pour la recherche d'information interlingue
RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...
متن کاملRegroupement sémantique de définitions en espagnol
De nos jours, l’utilisation de l’Internet pour la recherche de définitions est de plus en plus importante. Wikipédia et Medline sont devenu les sites les plus consultés de la Web. Or, il existe un énorme nombre de définitions qui sont parfois inaccessibles aux utilisateurs. Celles-ci peuvent se trouver dans des sites non encyclopédiques ou dans de documents divers. Dans cette perspective nous a...
متن کاملLOGUS : compréhension de l'oral spontané. Présentation et évaluation des bases formelles de LOGUS
RÉSUMÉ. Dans les systèmes de dialogue oral Homme-Machine, la compréhension de la parole spontanée est un problème difficile qui requiert des méthodes d’analyse robustes. La plupart des systèmes sont destinés à des actions très spécifiques : la compréhension repose sur la détection de mots ou segments clefs pour remplir les différents champs de requêtes prédéterminées. LOGUS, le système de compr...
متن کاملViolence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant
L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...
متن کامل